OBJECTIF : Analyser la base de données
# Import des données
data <- readRDS("/home/solene_petito/Bureau/Stage/Broken_devices/data/data1.rds") # base de données sur laquelle on va appliquer tous les changements
Broken_Devices_Data <- read.csv("/home/solene_petito/Bureau/Stage/Broken_devices/data/Broken-Devices-Data1-xlsx.csv",row.names=1) # base de données initiale sur laquelle on pourra se référer pour voir si les chgts ont bien été appliqués
# nombre d'observations
nb_obs <- nrow(data) # 968
# nombre de variables
nb_var <- ncol(data) # 164
La question posée était : Quel est le système d’exploitation de ce smartphone ?
Les réponses possibles étaient :
La plupart des propriétaires de smartphone ont donc des android (67% des personnes de la base).
Regardons maintenant le nombre de personnes rencontrant des dysfonctionnements pour chaque systèmes d’exploitation :
## Sytèmes.d.exploitation Nb_personnes Nb_personnes_dys Pourcentage_dys
## 1 IOS (Apple) 291 125 43
## 2 Android 652 264 40
## 3 Autre 12 7 58
## 4 Je ne sais pas 13 4 31
Le diagramme à barres suivant permet de visualiser cette répartition :
Le graphe suivant nous apporte plus de détails :
Parmis ces différents états quelle est la part de dysfonctionnements ?
## État Nb_personnes Nb_personnes_dys Pourcentage_dys
## 1 Neuf 792 316 40
## 2 D'occasion 88 45 51
## 3 Reconditionné 83 37 45
## 4 Je ne sais pas 5 2 40
La part de dysfonctionnements pour les smarthpones d’occasion est assez importante (50%), suivi des smartphones reconditionnés avec une part de 45% de dysfonctionnements.
Parmis les smartphones d’occasion, quelle était leur durée d’utilisation avant que le propriétaire l’obtienne, et quel impact cela a eu sur le fait que le propriétaire rencontre des dysfonctionnements ou pas ?
Le graphe suivant nous donne plus de détails :
label_duree_occas <- c("Moins de 6 mois","Entre 6 mois et 1 an","Entre 1 et 2 ans","Entre 2 et 3 ans","Entre 3 et 5 ans","Plus de 5 ans","Je ne sais pas")
df =data[which(data$ETATSMARTPHONE==2 & data$RIDENTIFICATION_PROBLEMES!="27"),"UTILISATIONSMARTOCCAS"]
total = nrow(data[which(data$ETATSMARTPHONE==2 & data$RIDENTIFICATION_PROBLEMES!="27"),]) # 45 obs
don2 <- as.matrix(table(df))
Categorie <- factor(label_duree_occas, levels = label_duree_occas)
don <- data.frame(Categorie=Categorie, valeurs=round(don2[,1]*100/total),2)
p <- ggplot(don, aes(x = Categorie, y =valeurs )) +
geom_bar(stat='identity',fill="turquoise4") +
theme_minimal() +
labs(title = "Ancienne durée du smartphone et pbs actuels",
x = "Ancienne durée du smartphone d'occasion",
y = "Pourcentage de personnes (%)") +
theme(plot.title = element_text(hjust = 0.5, face = "bold",colour="turquoise4"),
axis.title.x = element_text(face = "bold",colour="turquoise4"),
axis.title.y = element_text(face = "bold",colour="turquoise4"),
axis.text.x = element_text(angle = 45, hjust = 1, vjust = 1))
p_interactif <- ggplotly(p)
# Afficher le graphique interactif
p_interactif
Les différentes catégories pourraient être :
Problèmes matériels : Problème avec l’écran, Problème de sensibilité du tactile, Problème avec l’appareil photo, Problème avec la lampe torche ou le flash, Problème avec le micro, Problème de son, Problème de prise jack, Problème de chargement, Problème de batterie, Problème de capteurs, Problème avec les boutons, Problème de vibreur
Problèmes de connectivité (ou de réseau) : Problème avec le GPS, Problème de Wi-Fi, Problème de Bluetooth ou de transferts de fichiers sans fil, Problème de téléphonie, Problème d’accès à Internet
Problèmes logiciels : Système d’exploitation non mis à jour, Applications ne pouvant pas être téléchargées ou mises à jour, Fonctionnalité qui ne marche plus, Dysfonctionnement logiciel, Problèmes avec des applications
Problèmes de performance : Problème de lenteur, Stockage saturé
Problèmes divers : Problème lié à une fonctionnalité manquante, Autre
Le tableau suivant donne le nombre de dysfonctionnements rencontrés pour chaque catégorie, et la part de chaque catégorie par rapport au nombre total de dysfonctionnements qui est de 832 :
## Dysfonctionnements Nb_dys Pourcentage_dys
## 1 Matériel 392 47
## 2 Logiciel 160 19
## 3 Réseau 115 14
## 4 Performance 176 21
## 5 Divers 31 4
Le graphique à barres suivant permet de visualiser ces valeurs :
Parmis ces différentes catégories quels sont les types de gênes ressentis pour chacun des dysfonctionnements, le tableau suivant indique ces différents types de gênes ressenties pour chacunes des catégories en pourcentage :
## Dysfonctionnements Nb_dys Trés.gênant Plutôt.gênant Plutôt.pas.gênant
## 1 Matériel 392 31 46 19
## 2 Logiciel 160 29 50 19
## 3 Réseau 115 35 48 15
## 4 Performance 176 36 50 14
## 5 Divers 31 10 39 29
## Pas.gênant.du.tout
## 1 4
## 2 2
## 3 2
## 4 0
## 5 10
Le graphique à barres suivant permet de visualiser cette répartion :
La gêne ressentie parmis tous les dysfonctionnements et ce peut importe la catégorie, est en grande marjorité “plutôt gênante”.
Quelle est la part de résolution des dysfonctionnments entre ces catégories ?
On remarque que dans chaque catégorie, les dysfonctionnements majoritaires sont ceux étant matériels, suivi de ceux étant liés à la performance. Les parts des différentes catégories semblent être assez égales entre chaque types de résolution.
Le tableau suivant donne plus de détails pour chaque types de résolution, avec une part en pourcentage du type de dysfonctionnement concerné pour chaque type de résolution :
## Résolution Dys_Materiel
## 1 Oui et le problème est resolu 39
## 2 Oui mais le problème na pas pu être résolu 40
## 3 Non, le problème s’est résolu tout seul au bout d’un moment 34
## 4 Non, peut être plus tard 51
## 5 Non, je ne pense pas tenter de résoudre le problème 42
## Dys_Logiciel Dys_Reseau Dys_Performance Dys_Divers
## 1 18 18 21 4
## 2 18 14 26 1
## 3 29 17 17 3
## 4 14 11 22 2
## 5 20 12 21 4
Voici la répartition des temps de cohabitation pour les dysfonctionnements qui ont été résolus ou qui ont tenté d’être résolus :
Ce graphe nous montre que les problèmes de types matériel sont ceux qui ce règlent le plus vite.
Pour déterminer le temps de cohabitation avec les dysfonctionnements des individus n’ayant pas résolu pas le problème, il a fallu prendre le mois et l’année d’obtention de leur téléphone, puis pour chaque dysfonctionnement rencontré, le temps approximatif au bout duquel il se rendu compte du problème, et déterminer le temps qui séparait ce temps approximatif du mois de novembre 2023 (date du questionnaire). Voici les temps de cohabitation pour les personnes n’ayant pas résolu les problèmes :
Voici la même représentation mais avec la part de chaque catégorie de dysfonctionnements :
La grande part de problèmes avec lesquels les personnes cohabitent sont les problèmes matériels.
Voici une autre représentation mais sous forme de nuage de points, afin de mieux voir la répartition des valeurs :
On remarque que le temmps de cohabitation avec le problème lorsqu’on ne l’a pas résolu est de deux ans en trés grande marjorité, suivi de entre 6 mois et 2 ans.
Il serait intéressant de savoir le nombre de personnes ayant rencontré 1,2,3 ou plus de dysfonctionnements en fonction de l’année d’obtention de leur smartphone. On se concentre sur les 5 dernières années car c’est celles pour lesquelles le nombre de dysfonctionnements rencontrés est important. Le graphe suivant nous apporte ces détails :
On observe que de 2018 à 2020, le nombre de dysfonctionnements recontrés par individus est de 2 en général, et que vers 2021 il passe à 1.